Méthodes d’apprentissage faiblement supervisé : arbres de décision et classification itérative
نویسندگان
چکیده
This paper addresses the probabilistic classification trees training and test for weakly labelled data. We call "weakly labelled data", training set such as the prior labelling information provided refers to vector that indicates the probabilities for instances to belong to each class. Classification tree typically deals with hard labelled data, in this paper a new procedure is suggested in order to train a tree from weakly labelled data. Considering a random forest, we show how trees can be associated in the test step. An iterative classifier based on the tree is proposed too. The aim is to develop a procedure that modifies the label in order to extract a class. The proposed methods are compared with typical models such as generative and discriminative methods for object recognition and. The considered models are evaluated on standard datasets from UCI and an application to fisheries acoustics is considered.
منابع مشابه
Apprentissage de métrique appliqué à la classification de textes par méthodes à noyaux
Résumé – Dans cet article, nous proposons une méthode pour l’optimisation de la métrique d’un classifieur textuel à noyaux. Contrairement aux techniques populaires existantes, notre approche ne nécessite pas la définition explicite de règles sémantiques. Etant donné un ensemble d’apprentissage, l’algorithme proposé permet d’optimiser la matrice sémantique, sans qu’il soit nécessaire d’exhiber c...
متن کاملClassement d'objets incomplets dans un arbre de décision probabiliste
Résumé. Nous présentons une approche probabiliste pour déterminer les valeurs manquantes des objets incomplets pendant leur classement dans les arbres de décision. Cette approche est dérivée de la méthode d’apprentissage supervisé appelée Arbres d’Attributs Ordonnés proposée par Lobo et Numao en 2000, qui construit un arbre de décision pour chacun des attributs, selon un ordre croissant en fonc...
متن کاملApprentissage de la structure des processus de décision markoviens factorisés pour l’apprentissage par renforcement
Des algorithmes de planification récents issus de la théorie de la décision sont capables de trouver des politiques optimales ou quasi-optimales sur des problèmes de grande taille en utilisant le formalisme des processus de décision markoviens factorisés (FMDPs). Cependant, ces algorithmes ont besoin d’une connaissance a priori de la structure des problèmes qu’ils résolvent. Dans cette contribu...
متن کاملMéthodes à noyaux appliquées aux textes structurés
Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...
متن کاملSous-échantillonnage topographique par apprentissage semi-supervisé
Résumé. Plusieurs aspects pourraient influencer les systèmes d’apprentissage existants. Un de ces aspects est lié au déséquilibre des classes dans lequel le nombre d’observations appartenant à une classe, dépasse fortement celui des observations dans les autres classes. Dans ce type de cas assez fréquent, le système d’apprentissage a des difficultés au cours de la phase d’entraînement liées au ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2009